【知识学习】生成模型和判别模型

根据数据和目标,可以将各种学习方法划分为无监督学习、半监督学习和监督学习。

无监督学习就是构建模型训练的样本是没有label的;半监督学习是模型训练的样本部分存在label(如PULearning、小样本标记);监督学习即模型训练的正负样本明确。

在监督学习中包含生成学习和判别学习。

判别学习实质是建立在分类模型基础上,认为目标所属确定的类别,然后依据这些类别之间的差异计算出类别边界。通过目标的特征计算出其归属类别的概率

生成学习实质是拟合出不同类别的情况,构建相应的分布或者模型,然后目标计算出归属每个类别的概率,然后概率最大即为目标的所属类别

简单举例:

我们区分一家餐厅是否值得推荐,可能从味道、环境、卫生、服务等多方面评估

对于判别模型来说,会算出值得推荐和不值得推荐的餐厅在各个层面的差异,从而按照这种差异结果决定这家餐厅最终情况

对于生成模型来说,是分别举出值得推荐餐厅的特点和不值得推荐的餐厅的特点,然后对照这些特点来看这家餐厅分别归属两边的概率,最终归属哪类的概率大,来确定其是否值得推荐

判别模型

实质

按照类别的分界,直接判定其归属类别

模型

  • LR、FM、FFM
  • SVM
  • nn

特点

  • 基于梯度法去优化归属两类别的差异

生成模型

实质

分别针对每个类别计算其分布,目标需要算出归属每个类别的概率(或者联合概率分布)按照最终概率最大的那个确定归属类别

模型

  • native Bayes
  • HMM
  • GMM
  • Bayesian net

特点

  • 基于统计概率进行计算,如EM算法

results matching ""

    No results matching ""